查看原文
其他

遇到禁止复制该怎么办?幸好我会Python...

李运辰 Python研究者 2022-09-11

大家好,我是辰哥!


相信大家都有遇到这种情况(无法复制):



或者是这种情况



以上这种情况都是网页无法复制文本的情况。不过这些对于Python来说都不是问题。今天辰哥就叫你们用Python去解决。


思路:利用pdfkit库将html网页保存为pdf





01

小案例


1、安装pdfkit库


pip install pdfkit


通过命令安装pdfkit,此外还需要安装exe文件(wkhtmltopdf)。


下载链接:https://wkhtmltopdf.org/downloads.html



选择对于的版本下载并安装(记住自己的安装目录


2、小案例


先看一下这个网页(辰哥自己的网页:www.chenlove.cn



目标:将这个网页保存为pdf


import pdfkitimport time
if __name__ == '__main__': url = "http://www.chenlove.cn" config = pdfkit.configuration(wkhtmltopdf=r'D:\software\wkhtmltopdf\bin\wkhtmltopdf.exe') pdfkit.from_url(url, r"D:\公众号\0622\%s.pdf" % time.strftime('%Y-%m-%d-%H-%M-%S', time.localtime(time.time())), configuration=config)


其中的config就是上面安装的wkhtmltopdf的路径。


效果:



可以看到,我们已经成功将这个网页保存为pdf


下面我们开始尝试禁止复制的网页






02

实战



1、目标网站


这里我们现在简书平台的其中一篇文章进行测试(文章设置了禁止复制



比如我要进行复制的时候,同时禁止转载(不让复制),下面开始将这个网页保存pdf。


import pdfkitimport time
if __name__ == '__main__': url = "https://www.jianshu.com/p/717dc02a9c21" config = pdfkit.configuration(wkhtmltopdf=r'D:\software\wkhtmltopdf\bin\wkhtmltopdf.exe') pdfkit.from_url(url, r"D:\公众号\0622\%s.pdf" % time.strftime('%Y-%m-%d-%H-%M-%S', time.localtime(time.time())), configuration=config)



这样将内容保存为pdf就可以直接进行复制了。



感兴趣的小伙伴,可以尝试其他的网页(你懂得





03

小结


本文的讲解就到这里,内容主要是将网页保存为pdf,对于其他禁止复制的网页、长网页等都可以保存为pdf。大家下去可以去自己尝试。


一定要动手尝试一定要动手尝试一定要动手尝试!


最后说一声:原创不易,求给个赞、在看、评论



往期精彩回顾




分分钟教你Python Web开发框架Django


用Python爬取分析【某东618】畅销商品销量数据,带你看看大家都喜欢买什么


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存